1. 前言


如果让你用“⼀句话”或者“⼀个指标”来快速反映和描述某个业务应用系统当前的运行状态?你的答案是什么呢?


这是⼀个被IT运维团队和业务运营团队共同关注的问题,而要回答这个问题,要求业务应用系统监控和IT资源监控体系具备更广泛的场景融合能力。


业务应用系统监控和IT资源监控是整个运维体系建设中的核心能力之一,为故障预警发现、故障排查定位,故障分析以及处置结果确认三个重要的运维场景提供必要的基础支撑,为企业的数字化业务安全稳定运行保驾护航。

虽然业界有非常多的监控产品可供选择,但市面上暂时没有可以实现“全栈式IT资源监控”的运维监控产品或解决方案。因此,要做到“全方位IT资源监控覆盖”,必然会采⽤多个产品或解决方案的组合。

无论从哪个角度考虑,监控系统的核心职责是保证平台所有信息的及时采集、正确处理、准确告警和合理展示。基于某一服务的监控工具可深入了解其服务内的问题,但通常无法提供整个数字服务的整体监控分析。运维管理者难以对所有监控的服务都进行单独的分析展示。


2.传统监控已式微


传统的监控解决方案在数智化浪潮中已“王道式微”,“互联网+”时代需要新的可观测解决方案

在持续提供企业数字化转型贴近服务的过程中,我们逐渐发现,传统的被动式监控解决方案已经成为IT服务质效能进一步提升的阻碍,进一步阻碍技术对业务的支撑。

近年来诸多企业正在通过立项建设“统⼀运维监控平台”,融合现有的运维监控系统和解决方案,以“平台化能力”为目标,构建新全新的运维监控体系。


目前主流的“统⼀运维平台”实现方案是以将多个运维监控产品或解决方案进行平台化功能整合为驱动,打破各个独立系统间的筒仓和壁垒,实现跨系统的协同。


例如:单点登录和统⼀门户,消息和事件中心,统⼀数据分析和展示等。这在⼀定程度上提升了运维工作效率,使原本分散自治的IT监控⼯具或系统得以有效的整合。 


关键挑战

  • 传统被动式监控解决方案烟囱式割裂,运维监控手段和工具繁多,数据无法关联,导致故障定位难、事件分析难、数据应用难等。

  • 传统被动式监控以基础架构为视角,并以指标型数据监控为主。应用服务层视角缺失,让运维人员无法对整体业务运行的健康状态进行全局监测和有效判断。

  • 故障发生时并不能精准评估故障对业务的影响级别从而启动对应SLA的解决方案,存在“误报”,“漏报”等问题,业务监控“形同虚设”;故障定位时也存在现场还原难,故障定位和恢复效率低下等问题。

 

“新业务,新IT”,运维人迫切需要一个以主动观测、以业务服务为视角的新一代监控体系,让运维人员通览IT整体运行状态,化被动为主动。


3. 超融合 新架构


HyperInsight 超融合持续观测解决方案,立足运维视角,体现业务价值


无论是开源、商业版还是自研,每个运维监控产品或者解决方案都有自己独立的理念和技术路线,业界还尚未有统一、权威、被广泛可的,与IT资源监控相关的规范或标准释出。

因此,在实现“全方位IT资源监控覆盖的过程中,必然要面临“融合”问题,即:通过将多个运维监控产品或解决方案的数据、技术栈和处理过程进行融合,从IT运维层⾯实现“端到端的IT资源监控覆盖”。

“我们服务的客户越多,越发现客户的需求已经远远不是以前的建个数据中心,简单买些设备了,而是已经覆盖到‘端-边-云-网-智’,对企业的核心应用进行整体数智化转型规划,迫切需要“以业务为中心的”的一体化运维解决方案,连接IT和业务,为业务提供持续创新动能”,优维科技CEO王津银如是说。

 

经过数年来对客户场景的深入调研和分析,优维科技率先提出了超融合的技术架构,基于监控系统的数据能力,深挖监控数据的业务涵义,对外输出监控系统的业务价值。HyperInsight 超融合持续观测解决方案,全方位IT资源监控,提供跨多个IT服务完整的业务分析。


4. HyperInsight 


HyperInsight 超融合持续观测解决方案,横向融合市场主流IT系统架构,从传统巨石IT架构到现今的分布式微服务架构;纵向融合从基础IaaS层、PaaS层到应用层及业务层,实现从普通运维监控到系统洞察与业务洞察的提升。


面向业务应用系统的超融合IT资源监控体系,构建新⼀代面向双态IT和云计算架构的运维监控体系。以融合协同为导向,形成平台化的运维监控能力,并在此基础上,拓展更多高价值、有针对性的应用场景,提升运维团队工作效率的同时,充分释放运维团队的能力价值。